CUDA_VISIBLE_DEVICES=0 python -m vllm.entrypoints.openai.api_server  --host 0.0.0.0 --port 50072 --model /app/unsloth/gguf_model --served-model-name llama-3-unsloth 
